Datenanalyse

Die Temperatur folgt einem klaren, jährlichen Muster. Im Frühling erreichen die Temperaturen von etwa +5°C bis auf +15°C, im Sommer reichen sie von +10°C bis zu +30 °C in der Spitze, im Herbst von +5°C bis +20 °C und im Winter lediglich von -5°C bis etwa +10°C. Dieser Verlauf wiederholt sich jedes Jahr.

Die Boxplots nach Monaten zeigen noch einmal die jährliche Saisonalität.

Es handelt sich um einigermaßen um den Mittelwert normalverteilte Daten.

Korrelationsanalyse

Liniendiagramm (Verlauf)

Die Temperatur scheint dem Stromverbrauch zunächst entgegenzulaufen. Mit steigender Temperatur fällt der Stromverbrauch. Allerdings ist auch erkennbar, dass der Stromverbrauch Mitte des Jahres, wenn die Temperatur ihre Höchststände erreicht, ebenfalls wieder ansteigt.

Stromverbrauch nach Temperatur (Scatterplot)

Auch hier zeit sich, dass der Stromverbrauch bis zu Temperaturen von etwa 20°C fällt, dann stagniert und ab circa 24°C dann wieder ansteigt. Die gilt sowohl für Arbeits- wie auch für arbeitsfreie Tage.

Stromverbrauch nach Temperatur (Boxplot)

Auch hier zeit sich, dass der Stromverbrauch bis zu Temperaturen von etwa 20°C fällt, dann stagniert und ab circa 24°C dann wieder ansteigt. Je niedriger die Temperaturen sind, desto mehr Energie und damit auch Strom wird bspw. für das Heizen benötigt. Mit steigenden Temperaturen fällt zwar dieser Strombedarf, umgedreht wird allerdings mehr Energie für Kühlengen etc. benötigt. Ab einer Temperatur zwischen 20°C und 24°C gleichen die Einsparungen beim Heizen den Mehrbedarf bei Kühlungen nicht mehr aus und der Strombedarf steigt wieder an.

Regressionsanalyse

Durch die Regressionsanalyse wird geprüft, inwieweit sich der Verlauf des Stromverbrauchs anhand der verfügbaren exogenen Merkmale modellieren lässt. Es geht dabei noch nicht um die Erstellung eines Vorhersagemodells. Stattdessen wird die Regressionsanalyse eher mit Blick auf potenzielle Zusammenhänge, Korrelationen und Muster beziehungsweise generelle Verläufe durchgeführt. Aus diesem Grund bietet sich eine Funktion sechsten Grades an. Dafür wird mit den Daten von 2015 bis 2018 und den entsprechenden Merkmalen eine Regression sechsten Grades durchgeführt, welche dann mit den Daten für 2019 getestet wird. Wie bereits erwähnt, gibt es 2020 und 2021 Abweichungen vom ansonsten üblichen Verlauf. Daher werden nur die Daten bis einschließlich 2019 verwendet.

Regression mit Temperatur

Die Regression auf die Temperatur zeigt, dass sich hierdurch zumindest die jährliche Aufwärts- und Abwärtsbewegung abbilden lässt. Da allerdings Informationen über die Wochentage fehlen, kann die wöchentliche Saisonalität selbstverständlich nicht erfasst werden.

Regression mit Arbeitstag und Temperatur

Mittels Regression auf die Temperatur und den Indikator für Arbeitstage lässt sich sowohl die jährliche Auf- und Abwärtsbewegung wie auch die wöchentliche Saisonalität abbilden. Das Modell ist allerdings Anfang des Jahres leicht nach unten und Mitte/Ende des Jahres leicht nach oben verzerrt.

Insgesamt zeigt sich, dass der Stromverbrauch neben dem Indikator für Arbeitstage auch stark von der Temperatur abhängt. Die Temperatur wird daher für das weitere Modeling verwendet.

Fazit

Die Temperatur hat einen erkennbaren und direkten Einfluss auf dem Stromverbrauch und kann für Vorhersagen genutzt werden.

Daten speichern

Die als relevant und aussagekräftig ermittelten oder für Analysen relevanten Daten werden in der Datei „data.csv“ zwischengespeichert.